草庐IT

ios scheduledTimerWithTimeInterval 时间量

全部标签

mysql - 如何获得 hive 中时间戳的平均差异

我有下面的表格,其中包含两列hive>select*fromhivetable;a2016-09-16T03:01:12.367782Zb2016-09-16T03:01:12.300514Zc2016-09-16T03:01:12.241532Za2016-09-16T03:01:12.138016Zc2016-09-16T03:01:12.136986Zb2016-09-16T03:01:10.512201Zc2016-09-16T03:01:12.235671ZTimetaken:0.457seconds,Fetched:7row(s)现在我想从第一列中找到唯一值和时间戳差异,或

hadoop - 如何配置 hadoop rpc 的超时时间?

我的应用程序使用hadoop的rpc在分布式环境中远程发送/接收请求。org.apache.hadoop.ipc.RPC;org.apache.hadoop.ipc.RPC.Server;....this.server=RPC.getServer(this,this.peerAddr.getHostName(),this.peerAddr.getPort(),this.conf);this.server.start();随着任务越来越重,我观察到由于IOException(这可能是由线程中断引起的)导致的任务失败频繁。我怀疑异常是由某种RPC超时引起的。如何调整hadoop中RPC的超

hadoop - 如何使用 PIG 脚本获取两个纪元时间值之间的毫秒数

游戏ID|开始时间|结束时间1|1235000140|12350024572|1235000377|12350033003|1235000414|12350561281|1235000414|12350561282|1235000377|1235003300在这里,我想获取两个纪元时间字段BeginTime和EndTime之间的毫秒数。然后计算每场比赛的平均时间。 最佳答案 games=load'games.txt'usingPigStorage('|')as(gameid:int,begin_time:long,end_time:

mysql - 如何在配置单元中将时间戳转换为 gmt 格式

我的表中有一个时间戳列,我正在从时间戳列中派生一个名为dt_skey的列。为了清楚说明,我们假设时间戳列名称为time_column。这就是time_column看起来像2017-02-0503:33:50,dt_skey列看起来像这样20170205033350这只是删除之间的符号。我的问题是:time_column在美国东部时间,我想在从中导出dt_skey时将其转换为gmt格式。我想这样做的原因是当我们通过impala查询时,时间戳将被转换为gmt格式,而dt_skey不会被转换,因为它是一个int数据类型。我正在通过配置单元进行摄取,当我们通过配置单元查询时,时间戳和dt_sk

hadoop - 由于 UTC 时间, hive 中的日期转换问题

我有时间2017-05-04T23:25:23.234Z我想使用HIVE获取2017-05-0423:25:23.234。如何实现这一目标?实际数据-2017-05-04T23:25:23.234Z预期-2017-05-0423:25:23.234实际数据-2016-05-04T02:29:23.231234Z预期-2016-05-0402:29:23.231234请帮帮我 最佳答案 selecttranslate('2017-05-04T23:25:23.234Z','TZ','')2017-05-0423:25:23.234

时间序列的数据分析(七):数据变换

  之前已经完成了六篇关于时间序列的博客,还没有阅读过的读者请先阅读:时间序列的数据分析(一):主要成分时间序列的数据分析(二):数据趋势的计算时间序列的数据分析(三):经典时间序列分解  时间序列的数据分析(四):STL分解时间序列的数据分析(五):简单预测法时间序列的数据分析(六):指数平滑预测法数学变换在之前的博客中我们介绍了时间序列的加法季节性和乘法季节性,在加法季节性的时间序列数据中,季节性波动的幅度或者趋势周期项的波动不随时间序列水平的变化而变化,如下图所示:加法季节性的表达为:在上式中 表示时间序列数据,表示季节项,表示趋势-周期项,表示残差项。在乘法季节性的时间序列中,季节项或

hadoop - Hive 中的时间戳分区

我正在尝试在配置单元中创建基于时间戳的分区。但是配置单元正在创建基于数据的分区。下面是我的代码。有人可以帮忙吗?cattest1.shdat=`date+'%Y%m%d%H:%m:%S'`hive-fload.hql-hiveconffile_load_timestamp=$dat;catload.hqlINSERTOVERWRITEtableperm.testpartition(file_load_timestamp='${hiveconf:dat}')SELECTa,bFROMwork.temp;dt=20180102/=HDFS路径是这样创建的。dt=20180102103455

apache-spark - 使用 Apache Spark 获取大量时间范围的最快方法是什么?

我在Hadoop中有大约100GB的时间序列数据。我想使用Spark从1000个不同的时间范围内抓取所有数据。我已经尝试使用ApacheHive来创建一个非常长的SQL语句,其中包含大约1000个'ORBETWEENXANDYORBETWEENQANDR'语句。我也尝试过使用Spark。在这种技术中,我创建了一个具有相关时间范围的数据框,并将其加载到spark中:spark_session.CreateDataFrame()和df.registerTempTable()有了这个,我正在与新创建的时间戳数据框和更大的时间戳数据集进行连接。此查询需要很长时间,我想知道是否有更有效的方法来执

shell - 模式匹配 "hdfs ds -ls"输出时如何忽略时间戳?

我有存储在HDFS上的文件,其名称后缀有日期,与文件的修改日期不同,如下所示:$hdfsdfs-ls/a/b/c/d/e/*Found5itemsdrwxr-xr-x-xuserxuser02015-05-0113:59/a/b/c/d/e/exp_dt=2016-01-05drwxr-xr-x-xuserxuser02017-10-1015:42/a/b/c/d/e/exp_dt=2015-05-01我正在尝试查找仅具有给定exp_dt的文件。目前,努力如下:inputDir=/a/b/c/d/e/countCmd='hdfsdfs-ls$inputDir|grep'\.2015$'

hadoop - Hue UI 中的黑斑羚时间

我正在尝试估算Impala中从简单到复杂的查询所需的时间,并使用HueUI。是否可以通过UI知道完成查询所需的时间。 最佳答案 Impala或Hive仅提供进度的一般估计。Hue可以尝试通过根据当前进度推断开始时间来显示结束时间。欢迎关注https://issues.cloudera.org/browse/HUE-1219. 关于hadoop-HueUI中的黑斑羚时间,我们在StackOverflow上找到一个类似的问题: https://stackoverf